Model Selection

ImageNet Optimization

# ImageNet Optimization

Hiera Base 224 In1k Hf

Hiera is a hierarchical vision Transformer model that is fast, powerful, and concise. It surpasses state-of-the-art performance in a wide range of image and video tasks while significantly improving runtime speed.

Image Classification

Transformers English

A vision-language model initialized from OpenAI CLIP, adversarially fine-tuned on ImageNet with enhanced robustness features

Vision-language model initialized with OpenAI CLIP, enhanced robustness through unsupervised adversarial fine-tuning

Vit Hybrid Base Bit 384

The Hybrid Vision Transformer (ViT) model combines convolutional networks and Transformer architectures for image classification tasks, excelling on ImageNet.

Image Classification

Convnext Large 224

ConvNeXT is a pure convolutional model inspired by vision Transformers, trained on the ImageNet-1k dataset at 224x224 resolution.

Image Classification

Convnext Base 224

ConvNeXT is a pure convolutional model inspired by vision Transformers, trained on the ImageNet-1k dataset for image classification tasks.

Image Classification

Convnext Small 224

ConvNeXT is a pure convolutional model inspired by vision transformers, trained on the ImageNet-1k dataset, outperforming traditional vision transformers.

Image Classification

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase